Telegram Group & Telegram Channel
Что такое Local Sensitive Hash (LSH) и где он используется?

Это алгоритм, предназначенный для поиска ближайших соседей в больших наборах данных. Основывается на идее использования хеш-функции, которая переводит близкие объекты в один бакет (корзину).

У подходящих хеш-функций вероятность коллизии на близких объектах должна быть высокая, а на далёких — низкая. Иными словами, одинаковые хеш-значения должны с более высокой вероятностью присваиваться близким по некоторой метрике объектам.

При поиске ближайшего соседа для нового объекта сначала вычисляется его хеш-значение, а затем поиск ограничивается объектами в соответствующем бакете. Это позволяет значительно сократить объём данных, по которым необходимо провести поиск, а значит увеличить скорость обработки запросов.

LSH можно использовать в задачах, где требуется быстро находить похожие элементы в больших объёмах данных, например при поиске дубликатов документов или изображений в большом корпусе данных.

#машинное_обучение



tg-me.com/ds_interview_lib/230
Create:
Last Update:

Что такое Local Sensitive Hash (LSH) и где он используется?

Это алгоритм, предназначенный для поиска ближайших соседей в больших наборах данных. Основывается на идее использования хеш-функции, которая переводит близкие объекты в один бакет (корзину).

У подходящих хеш-функций вероятность коллизии на близких объектах должна быть высокая, а на далёких — низкая. Иными словами, одинаковые хеш-значения должны с более высокой вероятностью присваиваться близким по некоторой метрике объектам.

При поиске ближайшего соседа для нового объекта сначала вычисляется его хеш-значение, а затем поиск ограничивается объектами в соответствующем бакете. Это позволяет значительно сократить объём данных, по которым необходимо провести поиск, а значит увеличить скорость обработки запросов.

LSH можно использовать в задачах, где требуется быстро находить похожие элементы в больших объёмах данных, например при поиске дубликатов документов или изображений в большом корпусе данных.

#машинное_обучение

BY Библиотека собеса по Data Science | вопросы с собеседований


Warning: Undefined variable $i in /var/www/tg-me/post.php on line 283

Share with your friend now:
tg-me.com/ds_interview_lib/230

View MORE
Open in Telegram


Библиотека собеса по Data Science | вопросы с собеседований Telegram | DID YOU KNOW?

Date: |

Telegram is riding high, adding tens of million of users this year. Now the bill is coming due.Telegram is one of the few significant social-media challengers to Facebook Inc., FB -1.90% on a trajectory toward one billion users active each month by the end of 2022, up from roughly 550 million today.

The Singapore stock market has alternated between positive and negative finishes through the last five trading days since the end of the two-day winning streak in which it had added more than a dozen points or 0.4 percent. The Straits Times Index now sits just above the 3,060-point plateau and it's likely to see a narrow trading range on Monday.

Библиотека собеса по Data Science | вопросы с собеседований from no


Telegram Библиотека собеса по Data Science | вопросы с собеседований
FROM USA